这项工作的目的是为视障和盲人的触觉设备做出贡献,以便让他们了解周围人的行为并与他们互动。首先,基于来自RGB-D序列的人类行动识别的最先进方法,我们使用Kinect提供的骨架信息,与解开的和统一的多尺度图卷积(MS-G3D)模型识别执行的行动。我们在真实场景中测试了这个模型,发现了一些约束和限制。接下来,我们使用CNN的MS-G3D和深度模态应用骨架模型之间的融合,以绕过讨论的限制。第三,识别的操作是用语义标记的标记,并将被映射到触摸感知的输出设备。
translated by 谷歌翻译
大型语言模型开发的最新进展导致公众访问最先进的预训练的语言模型(PLM),包括生成培训的预训练的变压器3(GPT-3)(GPT-3)和Transformers(来自Transformers)的双向编码器(伯特)。但是,实际上,对PLM的评估表明,在培训和开发的微调阶段,它们对对抗性攻击的敏感性。这种攻击可能导致错误的输出,模型生成的仇恨言论以及用户敏感信息的暴露。尽管现有的研究集中在PLM的培训或微调期间的对抗攻击上,但有关这两个发展阶段之间攻击的信息不足。在这项工作中,我们重点介绍了GPT-3公开发行的主要安全漏洞,并进一步研究了其他最先进的PLM中的这种漏洞。我们将工作限制在没有经过微调的预培训模型中。此外,我们强调了令牌距离最小化的扰动作为一种有效的对抗方法,绕过受监督和无监督的质量措施。遵循这种方法,在评估语义相似性时,我们观察到文本分类质量的显着降低。
translated by 谷歌翻译
心电图(ECG)是用于监测心脏电信号和评估其功能的最常见和常规诊断工具。人心脏可能患有多种疾病,包括心律不齐。心律不齐是一种不规则的心律,在严重的情况下会导致心脏中风,可以通过ECG记录诊断。由于早期发现心律不齐非常重要,因此在过去的几十年中,计算机化和自动化的分类以及这些异常心脏信号的识别引起了很多关注。方法:本文引入了一种轻度的深度学习方法,以高精度检测8种不同的心律不齐和正常节奏。为了利用深度学习方法,将重新采样和基线徘徊清除技术应用于ECG信号。在这项研究中,将500个样本ECG段用作模型输入。节奏分类是通过11层网络以端到端方式完成的,而无需手工制作的手动功能提取。结果:为了评估提出的技术,从两个Physionet数据库,MIT-BIH心律失常数据库和长期AF数据库中选择了ECG信号。基于卷积神经网络(CNN)和长期记忆(LSTM)的组合,提出的深度学习框架比大多数最先进的方法显示出令人鼓舞的结果。所提出的方法达到98.24%的平均诊断准确性。结论:成功开发和测试了使用多种心电图信号的心律失常分类的训练有素的模型。意义:由于本工作使用具有高诊断精度的光分类技术与其他值得注意的方法相比,因此可以在Holter Monitor设备中成功实施以进行心律失常检测。
translated by 谷歌翻译
3D手姿势估计(HPE)是从任何视觉输入中将手关节定位在3D中的过程。由于HPE在各种人类计算机相互作用应用中的关键作用,HPE最近受到了更多的关注。最近的HPE方法证明了使用视频或多视图图像的优势,从而允许更强大的HPE系统。因此,在这项研究中,我们提出了一种新方法,用变压器进行手工姿势(sethpose)估计进行顺序学习。我们的sethpose管道首先是从单个手图像中提取视觉嵌入。然后,我们使用变压器编码器沿时间或查看角度学习顺序上下文,并生成准确的2D手关节位置。然后,使用具有U-NET配置的图形卷积神经网络将2D手关节位置转换为3D姿势。我们的实验表明,sethpose在颞叶和角度的两个手动序列品种上表现良好。此外,SETHPOSE优于该领域的其他方法,以实现两个公共可用的顺序数据集STB和Muvihand的最新结果。
translated by 谷歌翻译
高保真语义图像编辑的最新进展依赖于最先进的生成模型的概述潜在的潜在空间,例如风格。具体而言,最近的作品表明,通过线性偏移以及潜在方向,可以实现面部图像中的属性的体面可控性。几个最近的方法解决了这种方向的发现,隐含地假设最先进的GAN学习潜在空间,具有固有的线性可分离属性分布和语义矢量算术属性。在我们的工作中,我们表明,作为培训神经颂歌的流动实现的非线性潜在的代码操纵对于许多具有更复杂的非纹理变化因子的实用非面孔图像域有益。特别是,我们调查具有已知属性的大量数据集,并证明某些属性操作仅具有线性移位的挑战。
translated by 谷歌翻译